91 research outputs found

    Acceso a la información bilingüe utilizando ontologías específicas del dominio biomédico

    Get PDF
    Unos de los enfoques más prometedores en la Recuperación de Información Croslingüe es la utilización de recursos léxico-semánticos para realizar una indexación conceptual de los documentos y consultas. Hemos seguido esta aproximación para proponer un sistema de acceso a la información para profesionales sanitarios, que facilita la preparación de casos clínicos, y la realización de estudios e investigaciones. En nuestra propuesta se conecta la documentación de los pacientes (la historia clínica), en castellano, con la información científica relacionada (artículos científicos), en inglés y castellano, usando para ellos recursos de gran cobertura y calidad como la ontología SNOMED. Se describe asimismo como se gestiona la confidencialidad de la información.One of the most promising approaches to Cross-Language Information Retrieval is the utilization of lexical-semantic resources for concept-indexing documents and queries. We have followed this approach in a proposal of an Information Access system designed for medicine professionals, aiming at easing the preparation of clinical cases, and the development of studies and research. In our proposal, the clinical record information, in Spanish, is connected to related scientific information (research papers), in English and Spanish, by using high quality and coverage resources like the SNOMED ontology. We also describe how we have addressed information privacy

    A Domain-Adaptable Heterogeneous Information Integration Platform: Tourism and Biomedicine Domains.

    Get PDF
    In recent years, information integration systems have become very popular in mashup-type applications. Information sources are normally presented in an individual and unrelated fashion, and the development of new technologies to reduce the negative effects of information dispersion is needed. A major challenge is the integration and implementation of processing pipelines using different technologies promoting the emergence of advanced architectures capable of processing such a number of diverse sources. This paper describes a semantic domain-adaptable platform to integrate those sources and provide high-level functionalities, such as recommendations, shallow and deep natural language processing, text enrichment, and ontology standardization. Our proposed intelligent domain-adaptable platform (IDAP) has been implemented and tested in the tourism and biomedicine domains to demonstrate the adaptability, flexibility, modularity, and utility of the platform. Questionnaires, performance metrics, and A/B control groups’ evaluations have shown improvements when using IDAP in learning environmentspost-print2139 K

    Skills Match: cómo los datos abiertos permiten analizar la demanda de las habilidades no cognitivas en el mercado laboral

    Get PDF
    Las habilidades/competencias no cognitivas (NCS – non-cognitive skills) son habilidades centradas en los comportamientos y las actitudes que se consideran un subconjunto específico de las llamadas soft skills. Los empleadores y los expertos en recursos humanos las consideran muy importantes para la empleabilidad, priorizando este tipo de habilidades frente a las habilidades técnicas para una ocupación. A pesar de esta importancia, la situación actual en este ámbito está lastrada tanto por la falta de homogeneidad en la terminología y los conceptos como por la ausencia de estándares ampliamente aceptados. El proyecto Skills Match ha contribuido a resolver esta situación, creando en primer lugar un marco sólido de NCS que permite un nuevo enfoque para analizar la demanda de habilidades en ocupaciones específicas mediante el uso de datos abiertos de grandes iniciativas de la UE como ESCO u OVATE. A partir de la combinación de datos de distintas fuentes, es posible determinar con eficacia las NCS recomendadas para cada tipo de empleo en informática permitiendo a los docentes orientar la formación a los estudiantes.Non cognitive skills (NCS) are considered a specific subset of the so-called soft skills focused on behaviors and attitudes. Employers and human resources experts agree on their importance for employability, prioritizing this type of skills versus specific knowledge or skills for an occupation. Albeit its importance, the present scenario is hindered by the lack of homogeneity in terminology and concepts as well as the absence of widely used standards. The Skills Match project has contributed to solve this situation, firstly creating a solid NCS framework which, in the end, enables a new approach to analyze the demand of skills in specific occupations with open data from big EU initiatives like ESCO or OVATE. This new approach and the results of data analysis allows us to explain the most demanded and recommended NCS for ICT job positions, which will allow teachers to adapt the students’ training.Este trabajo ha sido cofinanciado por la Dirección General de Redes de Comunicación, Contenido y Tecnología de la Comisión Europea (DG CONNECT), en virtud del acuerdo de subvención no. LC-00822001 (OKT2017) para el proyecto Skills Match

    TMT: una herramienta para guiar a los usuarios en la búsqueda de información sobre textos clínicos

    Get PDF
    La gran cantidad de información médica disponible a través de internet, tanto en formato estructurado como en formato texto, hace que los distintos tipos de usuario se encuentren con diferentes problemas a la hora de efectuar una búsqueda efectiva. Por un lado, los estudiantes de medicina, el personal sanitario y los investigadores en el área de la biomedicina disponen de una gran variedad de fuentes y herramientas de características dispares, que precisan de un periodo de aprendizaje a veces insalvable. Por otro lado, los pacientes, sus familiares y personas que no pertenecen a la profesión médica, se encuentran con el problema añadido que supone no estar suficientemente familiarizados con la terminología médica. En este artículo presentamos una herramienta que permite extraer conceptos médicos relevantes presentes en un texto clínico, haciendo uso de técnicas para el reconocimiento de entidades nombradas, aplicadas sobre listas de conceptos, y técnicas de anotación a partir de ontologías. Para proponer los conceptos se hace uso de un recurso no formal de conocimiento, como es Freebase, y de recursos formales como son Medlineplus y Pubmed. Nosotros argumentamos que la combinación de estos recursos, con información menos formal y en lenguaje más divulgativo (como es Freebase), con información formal y en lenguaje más divulgativo (como es Medlineplus) o con información formal y en lenguaje más especializado (como son las publicaciones científicas de Pubmed), optimiza el proceso de localización de información médica sobre un caso clínico complejo a usuarios con diferentes perfiles y necesidades, tales como son los pacientes, los médicos o los investigadores. Nuestro objetivo último es la construcción de una plataforma que permita albergar diferentes técnicas para facilitar la práctica de la medicina traslacional.The large amount of medical information available through the Internet, in both structure and text formats, makes that different types of users will encounter different problems when they have to carry out an effective search. On the one hand, medical students, health staff and researchers in the field of biomedicine have a variety of sources and tools of different characteristics which require a learning period sometimes insurmountable. On the other hand, patients, family members and people outside of the medical profession, face the added problem of not being sufficiently familiarized with medical terminology. In this paper we present a tool that can extract relevant medical concepts present in a clinical text, using techniques for named entity recognition, applied on lists of concepts, and annotation techniques from ontologies. To propose these concepts, our tool makes use of a non formal knowledge source, such as Freebase, and formal resources such as MedlinePlus and PubMed. We argue that the combination of these resources, with information less formal and more plain language (like Freebase), with formal information and more plain language (like Medlineplus) or with formal information and more technical language (such as the Pubmed scientific literature), optimize the process of discover medical information on a complex clinical case to users with different profiles and needs, such as are patients, doctors or researchers. Our ultimate goal is to build a platform to accommodate different techniques facilitating the practice of translational medicine

    Integración de técnicas de procesamiento del lenguaje natural para la recuperación de información en bibliotecas de componentes software

    Get PDF
    En esta memoria se hace un estudio de la forma en que las técnicas y modelos desarrollados en torno a la recuperación de información (RI) pueden utilizarse en el desarrollo de sistemas de ayuda a la utilización de bibliotecas de componentes software (BCS). En el desarrollo de este tipo de sistemas se le asigna un papel central a la utilización de la documentación en lenguaje natural existente en las BCS. En nuestro trabajo investigamos las formas en que las técnicas de procesamiento del lenguaje natural (PLN) aplicadas a un análisis mas profundo de los textos y las consultas de los usuarios, pueden mejorar el proceso de recuperación. Se presenta el sistema argos, que hemos desarrollado como sistema de ayuda para la utilización de BCS en el que las técnicas de RI juegan un papel fundamental. El sistema argos se ha desarrollado como sistema de ayuda para el conjunto de ordenes del sistema operativo Unix y procesa el manual existente en formato electrónico en este entorno. Argos incluye diversos elementos y funcionalidades, tales como el modelado del usuario y funciones de navegación basadas en hipertexto, orientadas a proporcionar ayuda de la forma mas efectiva a los usuarios de las bcs. El sistema incluye un módulo que encapsula las funcionalidades más directamente relacionadas con las técnicas de RI. Este módulo se basa en el modelo del espacio vectorial, la utilización de pesos de términos, listas de parada y algoritmos de extracción de raíces. En nuestro estudio se ha hecho patente una importante evidencia experimental de que los sistemas basados en estas técnicas proporcionan una efectividad en el proceso de recuperación difícil de superar por otras aproximaciones. No obstante, y con el fin de mejorar la efectividad, se realiza un estudio profundo de la utilización de técnicas de pln para la ri. Se analizan los sistemas de ti que utilizan diversas técnicas de pln y se diferencian dos aproximaciones: la basada en la sintaxis y la basada en la semántica, los sistemas que siguen esta aproximación introducen mejoras en la efectividad del proceso de recuperación superiores a los basados en la sintaxis. La profundidad del análisis realizado por los diferentes sistemas que siguen una aproximación basada en la semántica varia de unos otros. Dos problemas comunes a todos los sistemas basados en la semántica son su especificidad de dominio y su importante esfuerzo de desarrollo. La principal aportación de esta tesis consiste en la propuesta de un nuevo modelo de sistema de ayuda para la utilización de bcs centrado en el procesamiento de las documentación en lenguaje natural existente en estos entornos. En este modelo se integran técnicas de PLN en la RI, siguiendo una aproximación basada en la semántica. Para materializar este modelo, se ha diseñado e implementado el sistema ares. El sistema se especializa en los problemas que plantea la brevedad de las descripciones de un numero importante de colecciones de componentes software. Ares procesa el conjunto de las 432 descripciones cortas de las ordenes de unix de la sección 1 del manual del sistema operativo. El sistema se ha diseñado de forma que se mejore la efectividad del proceso de recuperación, se disminuya el esfuerzo de desarrollo y se facilite su adaptación a otras colecciones de componentes software. Para reducir el esfuerzo de desarrollo, el léxico del sistema ares se ha construido de forma automática a partir de la información existente en una base de datos léxica, wordnet. Se ha definido una forma de representación semántica de las descripciones, basada en los roles de las gramáticas de casos y los significados de los términos originalmente definidos en wordnet. Para la implementacion del analizador-traductor, se ha desarrollado de forma incrementa una gramática de unificación que permite procesar correctamente el 64.8% de las descripciones cortas del manual. La gramática asi desarrollada se utiliza también para el procesamiento de las consultas de los usuarios. El método de calculo de la similitud entre descripciones y consultas se ha definido de forma que se considera la estructura semántica de las expresiones y los significados de los términos que aparecen en ellas. Finalmente, se ha desarrollado una serie de experimentos en los que se observan las mejoras en la efectividad conseguidas por el sistema

    Tareas de análisis del contenido textual para la recuperación de información con realimentación

    Get PDF
    La utilización de realimentación es una de las técnicas que proporciona mejoras más significativas en la efectividad del proceso de recuperación de información. Por otra parte, cada vez se utilizan en el proceso de recuperación de información, técnicas más avanzadas de análisis del contenido textual con vistas a mejorar la efectividad. En nuestro trabajo estudiamos los beneficios que proporciona la integración de mecanismos de análisis del contenido al utilizar la realimentación en el proceso de recuperación de información. Nos centramos en dos tareas de análisis: desambiguación de palabras y generación de resúmenes, presentando una sistemática para su utilización y experimentos asociados para la evaluación de las mejoras conseguidas.Este trabajo ha sido parcialmente financiado por: CICYT, proyecto TEL99-0335-C04-03; Ministerio de Industria y Energía, Iniciativa ATYCA, proyecto TS203/1999

    Information access system based on concepts using Freebase in Spanish-English over the domain medical and tourist

    Get PDF
    En este artículo presentamos una herramienta de acceso a la información, basado en los conceptos, enfocada tanto a textos médicos como turísticos. Usando técnicas para el marcado de entidades reconocidas, el sistema permite extraer conceptos relevantes para aportar más información sobre ellos utilizando bases de conocimiento colaborativas y ontologías. Componentes especialmente interesantes para el desarrollo del sistema son Freebase, una gran base de conocimiento colaborativa, además de recursos formales como MedlinePlus y PubMed. La arquitectura del sistema ha sido construida pensando en términos de escalabilidad, para constituir una gran plataforma de integración de información, con los siguientes objetivos: permitir la integración de diferentes técnicas de procesamiento de lenguaje natural y ampliar las fuentes desde las que se extrae información, así como facilitar la integración de nuevas interfaces de usuario.In this paper we present a tool for access to information, based on semantic, focused both medical texts and tourists. Using marking techniques for recognized entities, the system can extract relevant concepts to provide more information about them, using collaborative databases and ontologies. Particularly relevant components to its the development are Freebase, a large collaborative base of knowledge and formal resources such as MedlinePlus and PubMed. The platform architecture has been built thinking in terms of scalability, in order to constitute a great platform for information integration, with the following objectives: to allow the integration of different natural language processing techniques, to expand the sources from which information extraction can be performed and to ease integration of new user interfaces.Esta investigación ha sido financiada por el Ministerio de Ciencia y Tecnología Español MEDICAL-MINER (TIN-2009-14057-C03-01) y por la Comunidad de Madrid bajo el auspicio de la red de investigación MA2VICMR (S2009/TIC-1542)

    Recuperación de información médica mediante dispositivos móviles.

    No full text
    Las técnicas de recuperación inteligente de información aplicadas a la Historia Clínica Electrónica (HCE) y a las fuentes de información biomédica mejoran la seguridad del paciente gracias al conocimiento de la evidencia procedente de la investigación clínica y de los riesgos asociados a las características del paciente. Por ello, el acceso a esta información a través de dispositivos móviles como las PDAs constituye una herramienta muy útil para los profesionales médicos y un valioso complemento para otras prácticas médicas. En este artículo presentamos por un lado una descripción breve del proyecto SINAMED, cuyos retos principales están relacionados con el desarrollo de nuevos algoritmos de categorización y sumarización de textos en el dominio biomédico y de interfaces avanzadas para el acceso móvil a esta información, y por otro lado, algunos de los resultados obtenidos en relación con esta investigación.No data (2008)UE
    corecore